Nature | 可编程RNA引导的下一代基因组编辑系统
加星标,再也不怕错过更新!方法见文末动图。
基因组重排是生物基因组中的常见现象,包括插入、缺失和倒置等突变,对遗传多样性至关重要。这些重排通常由参与DNA修复过程(如同源重组)或病毒和移动遗传元件转位的酶协调。研究者们可以利用这些遗传机制开发具有独特性质的基因编辑工具。
2024年6月26日,Arc研究所的PatrickHsu团队在Nature发表了题为“Bridge RNAs direct programmable recombination of target and donor DNA”的研究论文,报道了一个最小且自主的移动遗传元件家族IS110,其能够表达一种结构化的非编码RNA,并且能够与其编码的重组酶特异性结合。该RNA通过两个内部的环状结构,与靶标DNA和供体DNA(即IS110元件本身)碱基配对,从而实现具有桥接的功能特性(Bridge RNAs)。研究证明了Bridge RNAs上与靶标结合和供体结合的环可以独立地重新编程,使得两个DNA分子之间的序列特异性重组成为可能。IS110桥接重组系统极大地丰富了基因编辑系统的多样性,不仅拓宽了原有以CRISPR和RNA干扰为基础的核酸引导体系,还为基因组设计中所需的三种基本DNA重排(插入、切除和倒置)提供了统一的机制。
背景
生物进化过程中出现了大量能够催化重新排列和多样化基因组的酶,这促使了新基因的出现和功能特化,同时为生物免疫力的提升以及病毒和移动遗传元件(MGEs)传播提供了基础。IS110元件作为一种剪切和粘贴的MGEs,它们能够无痕地从基因组中切除自身并产生环状形式,并且是唯一在其重组酶中使用DEDD催化基序的家族。IS110重组酶的N端DEDD结构域与RuvC Holliday连接分离酶具有同源性,展示出独特的作用机制。
IS621重组酶与ncRNA结合事件的鉴定
IS110元件核心中存在编码重组酶的序列(CDS),其长度约为300-460个氨基酸(图1a);核心中CDS两侧的序列被定义为左(LE)和右(RE)非编码端,在环化切除后,该元件在重组酶CDS上游远处的连接RE-LE的核心序列上重建启动子(图1b),进而ncRNA可以从该区域表达。与其他IS家族相比,IS110的非编码端长度的中位数最大(图1d),推测具有潜在的保守功能。研究者重点研究了IS110家族成员IS621,对含有编码预测的环状RE-LE连接序列的质粒的大肠杆菌进行小RNA测序(small-RNA-seq)揭示了一个从预测的内源性σ70样启动子开始,直至跨越LE的长约177bp连续的峰(图1e)。接下来,研究者使用微量热泳动(MST)验证了体外转录的177核苷酸长度的ncRNA(来自IS621)与IS621编码的重组酶具有较高的亲和力(图1f)。
图1. IS110 家族序列特征
通过ncRNA与DNA的协变关系推断ncRNA的潜在作用
通过评估103个不同直系同源物ncRNA共识的保守二级结构,研究者发现5′茎环后面存在着两个带有明显内部环的茎环结构(图1g)。为探索ncRNA是否参与到重组酶转座识别靶标 (Target) 和供体 (Donor) DNA的过程中,研究者系统地重建了数千个IS110的插入位点和环状形式(图2a)。在对2,201个Donor-ncRNA和5,511个Target-ncRNA的序列配对进行了共变分析后,研究者确定了可能与靶标或供体DNA的上链或下链结合的ncRNA片段,发现ncRNA的两个内部环与Target和Donor DNA序列之间存在的碱基配对关系(图2b)。将这种协变模式推广到IS621序列和ncRNA二级结构上,研究者推断第一个内部环可能与Target DNA碱基配对,而第二个内部环可能与Donor DNA碱基配对,并且这种机制在不同的IS110直系同源物中具有保守性。
图2. 鉴定ncRNA与靶向和供体位点的序列特征关系
确定IS621-ncRNA的生物学功能——桥连
先前研究IS110活性的尝试仅在IS110宿主生物中取得成功,而研究者将体外转录的ncRNA与纯化的IS621重组酶以及含有靶标和供体DNA序列的dsDNA底物孵育后,检测到了预计的重组产物(图2c-e),因此推断ncRNA可能是重构重组实验所需的缺失成分。
由于该RNA在连接靶标和供体DNA分子进行重组方面具有双特异性作用起到了类似于桥梁的作用,因此被命名为bridge RNA。Bridge RNA的两个内部环称为靶标结合环和供体结合环(图2g)。靶标结合环包含两个关键区域,分别与靶标DNA的上链和下链碱基配对:左靶标向导(LTG)与靶标DNA下链左侧(左靶标;LT)碱基配对,而右靶标向导(RTG)与靶标DNA右上链(右靶标;RT)碱基配对。供体结合环具有类似的结构,其中左供体向导(LDG)与左供体(LD)的下链碱基配对,右供体向导(RDG)与右供体(RD)的上链碱基配对(图2h)。
图2. Bridge-RNA结构与功能特征
可编程靶标位点选择
Bridge RNA识别靶标和供体的碱基配对机制表明了潜在的可编程性。研究者在大肠杆菌中建立了一个双质粒重组报告系统:pTarget编码IS621重组酶、50bp靶位点和启动子,pDonor编码包含RE–LE供体序列的Bridge RNA和无启动子的GFP。pDonor与pTarget重组会将GFP置于启动子的下游,使用流式细胞术可检测到成功的重组事件(图3a-b)。
图3. 筛选方法的构建
为了全面评估bridge RNA的错配耐受性和重编程规则,研究者设计了一个大肠杆菌筛选方法,将数千对条形码标记的DNA靶标和bridge RNA连接到单个质粒上,在筛选压力下只有与WT供体质粒成功重组的细胞可以存活(图4a)。通过这种方法,研究者首先证实bridge RNA与CT靶标核心序列的两条链之间的碱基配对具有强烈的偏好性,这与靶标和供体中CT核心序列的高度保守性一致(图4b)。接下来,研究者改变了靶标的9个非核心位置以及LTG和RTG的相应位置,以评估每个位置的单错配和双错配耐受性,结果展示出所有位置都具有高度的重编程灵活性(图4b-d)。
图4. 鉴定靶标位点的可编程性
编程bridge RNA的供体特异性
在IS621元素中,供体序列比基因组靶序列更保守,这表明供体结合环可能比靶标结合环更不容易重编程。为了评估这一点,研究者设计了一个供体特异性筛选方法,其中研究者改变了核心二核苷酸两侧的7bp LD和2bp RD,所有这些都在全长RE-LE的背景下进行,以顺式表达bridge RNA(图5a)对数千个供体和供体结合环对的分析表明,供体序列可以完全重编程(图5b)。与靶标和桥RNA的靶标结合环之间的相互作用类似,LD–LDG错配和RD–RDG错配通常耐受性较差(图5c)。LD的7号位置是个例外,它表现出对胞嘧啶的强烈偏好,因此似乎比其他位置更耐受错配(图5d,e)。
图5. 鉴定供体位点的可编程性
供稿 | 张睿涵
责编 | 囡囡
设计 / 排版 | 可洲 雨萱
微信号:FRCBS-THU
因扫码入群人员已满,可扫码添加中心官方微信号,管理员邀请入群
原文链接
https://www.nature.com/articles/s41586-024-07552-4
精彩回顾
精彩回顾
特别提示
微信公众号又双叒叕更改推送机制了,不是星标的订阅号,收到推送内容的时间会有延迟,甚至根本无法收到最新推送!不想错过FRCBS最新资讯,快来设为星标吧!
方法超简单,只需3秒钟!
点击上方卡片
关注我们吧
THE END
我知道你“在看”哟